Many-shot jaibreaking
https://scrapbox.io/files/668b72c2f58bbf001c0841c1.png
Claude
が出した資料
非常に長い
コンテキストウィンドウ
がLLMに対して新たな豊かな攻撃面を提供することを示唆している
https://www.anthropic.com/research/many-shot-jailbreaking
paper:
https://www-cdn.anthropic.com/af5633c94ed2beb282f6a53c595eb437e8e7b630/Many_Shot_Jailbreaking__2024_04_02_0936.pdf